民意调查这个定量研究的老祖宗,还能跟上这个时代吗?
「 民意调查这个“老祖宗”依旧是我们认识意见环境的可行方式吗? 」
作者 | Leighton Walter Kille, Andrew Mercer,
Claudia Deane, Kyley Mcgeeney
译者 | 杨 欣
编辑 | 杨开心
大家应该注意到,最近数洞推出了一系列由美国大选衍生的话题——沉默的螺旋、社交媒体的责任划定……今天划的重点是定量研究的老祖宗:民意调查。作为一个节操饱满、志在学术的公号,洞爷的使命可不光是追热点,更要在热点冷却之后追问“为什么”,从而让我们的思考不仅停留在热闹的表面。
重新注意民意调查的不止洞爷。北京大学新媒体研究院教授刘德寰老师昨天在其微信公众号“刘德寰”推送了一篇《美国民意调查简史》,和本文可以互为补充,感兴趣的读者可以去读读。
下面言归正传。
民意调查,我国基本没有(原因大家都懂),但就其在国外的实施来看,其自诞生起就一直面临各种质疑,因为其只在本身的设计、实施和分析框架内具有可信度。即便如此,民意调查仍是人类认识大范围意见环境的“最不坏”的方式。
不过新近又来了一次重大打击:川普的当选。有人指责新闻记者们在没有对民调的基本情况和潜在问题进行解释和预警之前,就对其进行大肆报道。
这是本次大选前Fivethirtyeight网站所做的预测
△图片来源:bolg.sina.com.cn
其实民意调查只不过是民意在某个时间点的概貌而已,记住这点很重要。失败的经验可以回溯到60年前,在1948年的总统大选中,Truman击败了Dewey,同时也显示了民调的失败。尽管有这样的先例和经验,民意调查者们还是会出现大纰漏:在2008年新罕布什尔州的民主党初选中,民调预测巴拉克·奥巴马会获胜,结果脱颖而出的却是希拉里·克林顿。
在变化不定的政治环境中,认为民调可以预测民意的分布是非常冒险的,哪怕预测前后仅相差了一小段时间。
大选民调为何会错得如此离谱?
一个可能的原因是民调专家所说的“无应答偏差”。尽管全体选民都有同等机会被调查覆盖到,当某类人群不对问卷作回应时,这种情形就会发生。我们知道一些群体(包括受教育程度较低的选民,他们是大选日对川普的选情进行统计的关键性人群),一向是民意调查难以到达的人群。有可能,选民身上驱动川普竞选活动的那种挫败感和反建制情绪,也使得他们不情愿对调查作应答。结果可能是强烈支持川普的人群的实际比例,并没有在民意调查的配比数据中得到体现。
有些迹象也表明,许多受访者并未诚实地回答他们的投票意愿。所谓“羞涩的川普支持者”这一称谓,表明支持川普并不符合社会期待,而且川普的支持者也不愿意在调查中承认他们支持川普。这种猜测不禁让人联想到“布兰德利效应”。在1982年加州的州长选举中,尽管民主党候选人、洛杉矶黑人市长Tom Bradley在民意调查中保持领先,他最终还是输给了共和党人George Deukmejian,据说这正是由于选民们不愿对调查人员说出他们不会把票投给一个黑人。
“羞涩的川普支持者”这一说法在今年备受关注。如果事实的确如此,我们可能会预期川普在网络调查中表现得更好,因为研究发现人们在面对真人调查者时,不大可能表现出不符合社会期待的行为。民意调查公司Politico/Morning Consult做了一个实验,来查证事实是否如此。实验发现,总体上民调几乎没有出现这种效应,不过他们确实找到了一些迹象,那就是受过高等教育的和收入较高的选民有可能更倾向于在网络上支持川普。
△图片来源:view.163.com
第三种可能,与调查者辨别实际投票选民的方法有关。由于我们无法提前预知哪些人会去投票,民调专家建立了模型来预测大选日的实际投票者以及选民情况。这是一个众所周知的难题,因为假设的毫厘之差将会导致预测结果的千里之谬。我们会发现,民意调查所预设的选民,特别是中西部和东北部那些与预期大相径庭的州的选民,并不是实际投票的那群人。
由于许多传统的潜在选民模型把对投票热情的测量纳入数据之中,2016年大选中那些确实没有投票热情的选民(至少在民主党这边),可能也造成了测量方面的一些混乱。
在民意调查没能准确预测2015年5月的英国大选结果后,一个由顶级专家组成的特别研究小组花了六个多月的时间,才让公众看到一份用数据说话的独立调查报告。有可能我们也需要这么多的时间来弄清这次大选的真相。调查行业的标杆组织——美国民意研究协会已经成立了特别委员会来对此次大选进行研究,并将于明年五月提出报告(该委员会由皮尤研究中心的调研主任Courtney Kennedy领导)。
民调机构清醒地认识到,这次大选凸显了民调行业所面临的严峻挑战。但这也是行业内进行全面实验和创新的时机。民主体制下民意调查的角色,远不只限于预测大选结果。其最理想的作用在于,它为每个人提供了同等发声的机会,使大选中难以顾及到的公众意愿和需求得以表达出来。这就是为何重建民意调查的可信度如此重要,也是我们一直致力于推动这项事业的原因。
民意调查怎么做才科学?
最理想的民意调查应该由独立的、无党派组织开展,在调查结果中不掺杂既定利益的成分。这些组织包括盖洛普、皮尤研究中心以及CBS 新闻/纽约时报、ABC 新闻/华盛顿邮报、NBC新闻/华尔街日报等媒介集团。
很多调查的实施者都是某个党派的成员——政治顾问公司、行业集团及候选人。有些情况下,调查结果会由于受访者的选择、问题措辞等因素而出现偏差。基于党派的民调需要被仔细检查,如果有可能,应该对照无党派的民调结果进行报道。
以下是记者和同学们应该熟知的一些民调知识:
民意调查通过访问较少的个体(样本),来推断更庞大的群体的意向。概率论的计算法则决定了如果足够的样本数量是真实地随机抽取而来,则样本的观点具有代表性。
样本规模是所有民调的关键:通常的法则是样本越多,抽样误差越小。正确抽取1000个样本的抽样误差大约在3%上下,这意味着样本所体现的不同意见的比例,在研究对象总体中可能占到3%左右。
所有科学的民意调查的受访者都是随机抽取的。主观抽取受访者的调查,例如街头访问和偶然参与的网络调查,具有内在的不科学性。
问卷形式、措辞和问题排序,会对调查结果产生显著影响。对于一些复杂的议题,例如早期关于人类胚胎干细胞的争论,调查者错误地测量了“无意见”和“无态度”,这是由于受访者在作答时并未仔细考虑过这个问题,仅仅因为调查机构联络到了他们。这种情形的民意调查,其结果会根据问题的措辞发生波动。
一般的投票问题会在大选之前测试选民的情绪。它们会问受访者,如果当天就是大选日,他们会把票投给民主党还是共和党,而不是直接问及候选人的名字。这样的调查问题固然可以得出总体情况的判断,却无法测量到选民对具体候选人和议题的看法。
投票问题可以通过面对面的方式来询问,也可以使用自动电话、电子邮件或信件。越来越多的美国人不愿意参与电话调查,加之只使用移动电话的家庭的增多,使得调查需要做的事情更为复杂。然而,电话调查比网络调查在准确度方面表现得更好。不管使用哪种调查技术,重要的是理解如何实施调查,并且在对可能有方法论问题的民意调查进行报道时,保持谨慎。
如果受访者提供的答案并不是他们的真实想法,而是他们认为社会可接受的回答,结果就会发生社会期待偏差。这种偏差通常出现在一些有难度的议题中,例如堕胎、种族、性取向和宗教问题。
当心“驱策型”民调,这种民调将政党组织的意图进行了小心的伪装,用来左右选民的意愿,而不是测量它们。
有些调查结果的报道是基于“调查的调查”,是将多个调查杂糅在一起得来。这种报道的代表性网站有Five Thirty Eight,Real Clear Politics 和Cook Political Report。然而,人们对于如何准确平衡多个调查的结果有争议,有些统计学家也对混合调查持反对态度。
在报道民意调查的时候,应把如何实施民调的具体信息包含在内——在什么时间、用什么方法、对哪些人进行调查。报道应涵盖样本规模、误差幅度、调查实施机构及它们是否怀有意识形态偏见。避免使用调查的专业术语,尽量用清晰易懂的语言对调查结果进行描述。
必要时,将多个不同的调查进行对比。如果同一问题在两个不同的时间点被提出,会发生什么变化?如果两个同时进行的调查给出了不同的结论,找出原因。与无偏见的调查专家或学者进行讨论,请他们提供专业意见。假若你找不到这样的专家来对调查结果进行更全面深刻的剖析,那就谨慎地撰写报道。
新闻专题中的民意调查,往往会强调政治运动的“赛马”特性。赛马框架(horserace frame)把候选人之间的名次竞争描绘成一场赛马比赛,看今天谁领先了,明天是否又被超过了——它并不关注候选人究竟提出了什么政策(注:此观点见公号“新闻实验室”2016年11月18日文章)。这一焦点会使同等或更重要的调查结果黯然失色,比如选民对议题的看法,以及其如何影响他们对候选人的偏好。
△图片来源:bolg.sina.com.cn
本文综合自:
Polling fundamentals and concepts: An overview for journalists,作者: Leighton Walter Kille
Why 2016 election polls missed their mark,作者:Andrew Mercer, Claudia Deane, Kyley Mcgeeney,
本文的撰写还参考了以下学者或机构的著作:
哈佛大学政府与媒体讲座教授、Journalist’s Resource研究主任Thomas Patterson
雪城大学Knight基金会政治报告主席Charlotte Grimes
康涅狄格大学Roper舆论研究中心
△封图来源:topit.me
推荐阅读: